home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / icon / newsgrp / group00b.txt / 000164_icon-group-sender_Tue Nov 28 07:56:52 2000.msg < prev    next >
Internet Message Format  |  2001-01-03  |  5KB

  1. Return-Path: <icon-group-sender>
  2. Received: (from root@localhost)
  3.     by baskerville.CS.Arizona.EDU (8.11.1/8.11.1) id eASEuAs12554
  4.     for icon-group-addresses; Tue, 28 Nov 2000 07:56:10 -0700 (MST)
  5. Message-Id: <200011281456.eASEuAs12554@baskerville.CS.Arizona.EDU>
  6. Date: Mon, 27 Nov 2000 22:45:07 -0600
  7. From: gep2@terabites.com
  8. Subject: Re: NLP Tools in ICON
  9. To: jsampson@indexes.u-net.com, icon-group@cs.arizona.edu
  10. Errors-To: icon-group-errors@cs.arizona.edu
  11. Status: RO
  12. Content-Length: 4121
  13.  
  14. > I asked in the Icon group mailing list about the Porter stemming algorithm
  15. but as there was no response I wrote a very rough one of my own. The Porter
  16. stemming algorithm is available on the Web in C, Perl and Java codings. For
  17. my purposes (medical terms) I have not been very impressed with its
  18. performance, at least in my implementation, but I am probably asking it to
  19. do things it was not meant for. 
  20.  
  21. In general, I don't think either SNOBOL4 or Icon are necessarily the languages 
  22. of choice if you have *REALLY* hard-core, full-bore number crunching that you 
  23. have to do.  (If programming time is the bigger issue, then it's possible they 
  24. STILL are).
  25.  
  26. > I have been taking some interest in Snobol. It seems the company making the
  27. SPITBOL implementation can ask a four-figure price for it, a fact which
  28. intrigues me, when the more sophisticated language Icon is free. 
  29.  
  30. True about the SPITBOL pricing, but the four-figure prices are really only if 
  31. you're going to get the mainframe or Unix server versions.  If you're planning 
  32. to use it (like most of us) on a PC running under some flavor of either Windows 
  33. or OS/2, it's priced rather along the lines of other commercial compilers (and 
  34. MUCH less than, say, IBM's PL/1).  The latest price for SPITBOL386 that I've 
  35. seen on the Catspaw Web page (http://www.snobol4.com) is $295.  Which, yeah, 
  36. isn't being given away but OTOH if you really use the product very much (and I 
  37. use it CONSTANTLY) you ought to save enough time on **one** programming project 
  38. (quite possibly even on ONE PROGRAM) to make that cost back, and probably 
  39. several times over.
  40.  
  41. > ...It makes me think that must be where the action is, rather than with Icon. 
  42. However, there is not much going on in the Snobol mailing list either.
  43.  
  44. I think that BOTH lists are largely inhabited by people who are busier "doing" 
  45. than just "talking about doing", and therefore spend much of their time there in 
  46. "lurk mode".  When interesting topics turn up (which does happen from time to 
  47. time) you can get quite an amazing flurry of activity indeed.  :-)
  48.  
  49. Basically this is a tool which just simply WORKS, so there really isn't much 
  50. need to have a place to conduct a continual bitchfest or anything.  
  51.  
  52. My own personal most recent project (and I actually used a combination of 
  53. SPITBOL386 and SNOBOL4+ for it) was developing programs to read and recover data 
  54. and source programs from a seriously garbled 1Gb hard drive... garbled badly 
  55. enough that the partition sector, boot sector, FAT and root directory were 
  56. essentially gone.  I essentially had to write a SNOBOL4+ loadable function to 
  57. retrieve data at the raw sector level (and I wrote that in assembly language... 
  58. something I've done very little of in the last few years!), and a couple of 
  59. SNOBOL4+ programs to read and create binary disk image files (which can then be 
  60. read subsequently without constant and annoying error retry delays), along with 
  61. the ability to merge image files from several passes (since a lot of these read 
  62. errors, curiously, end up being transient).  Next I wrote various SPITBOL 
  63. programs to pattern match within the binary image files to identify sectors 
  64. containing line-oriented text, non-delimited ASCII data (in this case, usually 
  65. FoxPro database sectors), FoxPro database headers, etc, and then within the 
  66. probable database sectors recovered to match data records of various crucial 
  67. types.  (It's fairly rare for me to write programs for clients which crunch for 
  68. literally a day or more solid...).   
  69.  
  70. Although I own copies of both SNOBOL4+ and SPITBOL386 (and Icon too of course, 
  71. although I admit I use S*BOL *far* more than I actually use Icon), and I 
  72. certainly enjoy the exhilarating speed of SPITBOL, I do write even new programs 
  73. using both compilers depending on the job I'm doing.  SNOBOL4+ is still an 
  74. excellent product, and it's freeware.
  75.  
  76. Gordon Peterson
  77. http://personal.terabites.com/
  78. Support the Anti-SPAM Amendment!  Join at http://www.cauce.org/
  79. 12/19/98: the day the Conservatives demonstrated their scorn for their
  80.    fraudulent sham of representative government.  Voters, remember it!
  81.  
  82.